Choix du taux d'élagage pour l'extraction de la terminologie. Une approche fondée sur les courbes ROC
نویسندگان
چکیده
Résumé. Le choix du taux d’élagage est crucial dans le but d’acquérir une terminologie de qualité à partir de corpus de spécialité. Cet article présente une étude expérimentale consistant à déterminer le taux d’élagage le plus adapté. Plusieurs mesures d’évaluation peuvent être utilisées pour déterminer ce taux tels que la précision, le rappel et le Fscore. Cette étude s’appuie sur une autre mesure d’évaluation qui semble particulièrement bien adaptée pour l’extraction de la terminologie : les courbes ROC (Receiver Operating Characteristics).
منابع مشابه
Classification par voisinages successifs sur des descriptions morphologiques complexes
Résumé. Afin de classifier des descriptions morphologiques issues de bases de connaissances en biologie, nous proposons une méthode de fouille de données incrémentale, interactive et semi-dirigée. Cette méthode est fondée sur la construction itérative du voisinage de la description partielle de l’objet à classer. Nous proposons différents indices de similarité adaptés à la nature complexe des d...
متن کاملExploitation de l'asymétrie entre termes pour l'extraction automatique de taxonomies à partir de textes
Résumé. Nous présentons dans cet article une nouvelle approche pour la génération automatique de structures lexicales (ou taxonomies) à partir de textes. Cette tâche est fondée sur l’hypothèse forte selon laquelle l’accumulation de faits statistiques simples sur les usages en corpus permet d’approximer des informations de niveau sémantique sur le lexique. Nous utilisons la prétopologie comme ca...
متن کاملRecherche par le contenu dans des documents audiovisuels multilingues
RÉSUMÉ. Nous présentons dans cet article une approche basée sur l’utilisation de l’Alphabet Phonétique International (API) pour l’indexation et la recherche par le contenu de documents audiovisuels multilingues. L’approche fonctionne même si les documents contiennent des langues inconnues. Elle a été validée dans le cadre de la compétition « Star Challenge » sur les moteurs de recherche organis...
متن کاملفایل کامل مجلّه مطالعات زبان فرانسه دو فصلنامه علمی پژوهشی زبان فرانسه دانشکده زبانهای خارجی دانشگاه اصفهان
Tâ ÇÉÅ wx W|xâ Revue des Études de la Langue Française Revue semestrielle de la Faculté des Langues Étrangères de l'Université d'Ispahan Cinquième année, N° 8 Printemps-Eté 2013, ISSN 2008- 6571 ISSN électronique 2322-469X Cette revue est indexée dans: Ulrichsweb: global serials directory http://ulrichsweb.serialssolutions.com Doaj: Directory of Open Access Journals http://www.doaj.org ...
متن کاملLOCAL-GENERATOR : "diviser pour régner" pour l'extraction des traverses minimales d'un hypergraphe
Résumé. Du fait qu’elles apportent des solutions dans de nombreuses applications, les traverses minimales des hypergraphes ne cessent de susciter l’intérêt de la communauté scientifique et le développement d’algorithmes pour les calculer. Dans cet article, nous présentons une nouvelle approche pour l’optimisation de l’extraction des traverses minimales basée sur les notions d’hypergraphe partie...
متن کامل